Modello di apprendimento automatico basato su cartelle cliniche elettroniche |JHC

2022-09-17 01:41:17 By : Mr. Tony Huang

Javascript è attualmente disabilitato nel tuo browser.Diverse funzionalità di questo sito non funzioneranno mentre javascript è disabilitato.accesso aperto alla ricerca scientifica e medicaDalla presentazione alla prima decisione editoriale.Dall'accettazione editoriale alla pubblicazione.La suddetta percentuale di manoscritti è stata respinta negli ultimi 12 mesi.Riviste scientifiche e mediche peer-reviewed ad accesso libero.Dove Medical Press è membro dell'OAI.Ristampe in blocco per l'industria farmaceutica.Offriamo vantaggi reali ai nostri autori, inclusa l'elaborazione accelerata degli articoli.Registra i tuoi dettagli specifici e farmaci specifici di interesse e abbineremo le informazioni fornite agli articoli dal nostro ampio database e ti invieremo prontamente copie PDF via e-mail.Torna a Diari » Journal of Hepatocellular Carcinoma » Volume 9Autori An C , Yang H, Yu X, Han Z, Cheng Z , Liu F, Dou J, Li B, Li Y, Li Y, Yu J , Liang PPubblicato il 28 luglio 2022 Volume 2022:9 Pagine 671—684DOI https://doi.org/10.2147/JHC.S358197Revisione tramite revisione tra pari anonima singolaEditore che ha approvato la pubblicazione: Dr Xin Wei WangChao An,1,* Hongcai Yang,1,2,* Xiaoling Yu,1 Zhi-Yu Han,1 Zhigang Cheng,1 Fangyi Liu,1 Jianping Dou,1 Bing Li,3 Yansheng Li,4 Yichao Li,4 Jie Yu ,1 Ping Liang1 1Dipartimento di Ultrasuoni, PLA Medical College & 5th Medical Center of Chinese PLA General Hospital, Pechino, 100853, Repubblica popolare cinese;2Scuola di Medicina, Università di Nankai, Tianjin, Repubblica Popolare Cinese;3National Laboratory of Pattern Recognition (NLPR), Institute of Automation, Chinese Academy of Sciences, Beijing, People's Republic of China;4DHC Mediway Technology CO, Ltd, Pechino, Repubblica popolare cinese *Questi autori hanno contribuito in egual modo a questo lavoro Corrispondenza: Ping Liang;Jie Yu, Department of Ultrasound, PLA Medical College & 5th Medical Center of Chinese PLA General Hospital, Pechino, 100853, Repubblica popolare cinese, Tel +86-10-66939530, Fax +86-10-68161218, Email [email protected] ;[email protected] Contesto e scopo: la recidiva precoce (ER) rappresenta una sfida per la prognosi di sopravvivenza dei pazienti con carcinoma epatocellulare (HCC).Lo scopo di questo studio era di studiare i modelli di apprendimento automatico (ML) utilizzando dati clinici per la previsione di ER dopo ablazione a microonde (MWA).Metodi: tra agosto 2005 e dicembre 2019, 1574 pazienti con carcinoma epatocellulare in stadio iniziale sono stati sottoposti a MWA in quattro ospedali.Quindi, sono stati raccolti 36 punti di dati clinici per paziente e i pazienti sono stati assegnati al set di convalida di formazione, interno ed esterno.Oltre alla tradizionale regressione logistica (LR), tre modelli ML - foresta casuale, macchina vettoriale di supporto ed eXtreme Gradient Boosting (XGBoost) - sono stati costruiti e convalidati per la loro capacità predittiva con l'area sotto la curva ROC (AUC).Per realizzare la loro interpretabilità sono stati utilizzati algoritmi come SHapley Additive exPlanations (SHAP) e le spiegazioni agnostiche del modello interpretabile locale (LIME).Risultati: I tre modelli ML hanno tutti superato LR (P <0,001 per tutti) in termini di capacità predittiva.Quando nove variabili (numero del tumore, piastrine, α-fetoproteina, punteggio di comorbilità, globuli bianchi, colinesterasi, tempo di protrombina, neutrofili ed eziologia) sono state estratte simultaneamente utilizzando l'eliminazione ricorsiva delle caratteristiche con convalida incrociata, il modello XGBoost ha ottenuto la migliore discriminazione tra tutti i modelli, con un valore AUC 0,75 (IC 95% [intervallo di confidenza]: 0,72–0,78) nel training set, 0,74 (IC 95%: 0,69– 0,80) nel set di validazione interna e 0,76 (IC 95%: 0,70 – 0,82) nel set di validazione esterna, ed è stato interpretato in base alla visualizzazione dei fattori di rischio da parte degli algoritmi SHAP e LIME.Il sistema predittivo di stratificazione del rischio di recidiva post-ablazione è stato fornito online (http://114.251.235.51:8001/) sulla base dell'analisi XGboost.Conclusione: il modello XGBoost basato su dati clinici può prevedere efficacemente il rischio di ER dopo MWA, il che può contribuire alla sorveglianza, alla prevenzione e alle strategie di trattamento dell'HCC.Parole chiave: ablazione a microonde, carcinoma epatocellulare, recidiva, machine learning, stratificazione del rischioL'ablazione a microonde (MWA) è un trattamento efficace per i pazienti con carcinoma epatocellulare (HCC) in stadio iniziale.Tuttavia, in effetti, il tasso di recidiva epatica precoce, comprese le recidive locali e le recidive epatiche a distanza, può raggiungere circa il 30%.Inoltre, il margine ablativo di 5 o 10 mm è sempre correlato a recidive locali, che attirano l'attenzione degli studiosi.A causa della mancanza di un modello altamente affidabile che preveda la recidiva post-ablazione, abbiamo sviluppato un sistema di intelligenza artificiale basato su modelli di apprendimento automatico (ML) utilizzando grandi set di dati clinici estratti direttamente dalle cartelle cliniche elettroniche per prevedere la ricorrenza e fornire una guida per MWA.In particolare, abbiamo utilizzato le spiegazioni dell'additivo SHapley e gli algoritmi di spiegazioni indipendenti dal modello interpretabile locale per realizzare l'interpretabilità del modello ML.Questo sistema ML può migliorare il probabile successo del trattamento MWA e guidare la gestione clinica dopo l'ablazione termica dell'HCC.Il carcinoma epatocellulare (HCC), il quinto tumore maligno più comune, deriva da infezioni virali dell'epatite e provoca mortalità e morbilità considerevoli in Cina.1–3 L'ablazione locoregionale (LA) è raccomandata come trattamento di prima linea nei pazienti con carcinoma epatocellulare allo stadio iniziale, così come per la resezione chirurgica (SR) e il trapianto di fegato (LT),4–6 secondo molteplici linee guida internazionali.Inoltre, LA come trattamento primario e alternativo è ampiamente applicato anche nei pazienti con carcinoma epatocellulare che non sono idonei alla chirurgia e viene utilizzato come ponte per LT,7,8 con il vantaggio di un minor trauma, una migliore ripetibilità, meno complicanze e una migliore efficacia dei costi.L'ablazione a microonde (MWA) è un'efficace tecnologia LA a causa della maggiore temperatura intratumorale e di una regione più massiccia di necrosi cellulare, con una sopravvivenza globale (OS) comparabile a 5 anni per l'HCC allo stadio iniziale, simile a SR,9,10 MWA è un'opzione curativa per piccole lesioni HCC, ma la recidiva post-ablazione si è verificata comunemente per la progressione del carcinoma de novo residuo e la disseminazione di lesioni microscopiche.Sfortunatamente, il tasso di circa il 50% di recidive intraepatiche a 5 anni (recidive locali e recidive a distanza) dopo MWA rimane una grande sfida nella pratica clinica.In particolare, la recidiva precoce (ER) (considerata generalmente inferiore a 2 anni) può causare una prognosi infausta.Tra questi, mentre i tassi di recidiva locale sono bassi in mani esperte, il tasso è variabile, essere in grado di prevedere chi è probabile che abbia una recidiva locale potrebbe consentire migliori opzioni di trattamento.Ad esempio, la stratificazione del rischio di recidiva post-ablazione può aiutare i radiologi interventisti a progettare la strategia di ablazione e i farmaci post-ablazione (p. es., chemioembolizzazione arteriosa transcatetere preventiva [TACE] o inibitori della tirosin-chinasi multi-mirati [TKI]).11Una grande quantità di dati clinici può essere ottenuta facilmente da un sistema di cartelle cliniche elettroniche.Tuttavia, questi dati interferiscono comunemente tra loro e indeboliscono il potere predittivo dei metodi statistici tradizionali (ad es. regressione di Cox e regressione logistica [LR]) a causa della loro scarsa capacità di calcolo per analizzare le caratteristiche cliniche multidimensionali.È difficile identificare con precisione gli indicatori biologici ottimali per la recidiva.L'apprendimento automatico (ML) è una branca dell'intelligenza artificiale che impiega tecniche statistiche, probabilistiche e di ottimizzazione per addestrare una macchina all'apprendimento.12,13 Gli algoritmi ML possono apprendere dai dati clinici, identificare modelli e prendere decisioni con il minimo intervento umano da parte di automatizzare la costruzione di modelli analitici, che è stato utilizzato per calcolare la probabilità del risultato futuro di un individuo specifico in modo da ottenere modelli di previsione del rischio.In questo studio, abbiamo sviluppato e convalidato più modelli ML utilizzando dati clinici estratti direttamente dalle cartelle cliniche elettroniche per prevedere il rischio di ER dopo MWA per HCC in fase iniziale, con l'obiettivo di costruire un metodo favorevole per fornire una guida per la selezione dell'indicazione MWA e per l'HCC preoperatorio pianificazione.Questo protocollo di studio retrospettivo e multicentrico è stato approvato dal Comitato Etico di tutte le istituzioni partecipanti (Chinese PLA General Hospital, The Third Affiliated Hospital of Harbin Medical University, The Second Hospital of Nanjing e The Tianyou Hospital of Wuhan University of Science and Technology ). Poiché si tratta di uno studio retrospettivo, il requisito del consenso informato scritto è stato revocato dopo aver ottenuto l'approvazione di ciascun comitato etico.Tutti i partecipanti a questo studio hanno promesso di mantenere la riservatezza di tutti i dati dei pazienti e di attenersi rigorosamente alla Dichiarazione di Helsinki.Tra agosto 2005 e dicembre 2019, un totale di 2423 pazienti con carcinoma epatocellulare che successivamente sono stati sottoposti ad ablazione percutanea a microonde ecoguidata (US-PMWA) sono stati prelevati da un database medico presso quattro centri medici ad alto volume in Cina e rivisti.La durata del follow-up è stata interrotta a luglio 2020. L'HCC è stato diagnosticato secondo le linee guida dell'Associazione europea per lo studio del fegato (EASL) e dell'Associazione americana per lo studio delle malattie del fegato (AASLD).14,15 Dettagli di Il reclutamento dei pazienti è delineato secondo i seguenti criteri di inclusione: a) pazienti con carcinoma epatocellulare che hanno raggiunto l'ablazione completa;b) pazienti con performance status ECOG (Eastern Cooperative Oncology Group) di 0 o 1;c) pazienti con grado Child–Turcotte–Pugh (CTP) A o B;d) pazienti con un singolo tumore ≤ 5 cm o un diametro massimo dei tumori ≤ 3 cm quando il numero dei tumori ≤ 3;e) pazienti senza infiltrazione vascolare maggiore o metastasi extraepatiche.Criteri di esclusione: a) pazienti con carcinoma epatocellulare associato ad altri tumori maligni;b) pazienti con ablazione incompleta;c) pazienti con trattamento precedente prima di MWA, esclusi SR e LT;d) pazienti persi al follow-up > 6 mesi.Infine, i dati di 1574 pazienti con HCC (307 femmine e 1267 maschi; età media, 58,4 ± 11,2 anni) con 2100 lesioni HCC (diametro medio, 2,4 ± 0,9 cm) nelle cartelle cliniche sono stati sottoposti a screening per l'idoneità.La Figura 1 mostra il percorso di arruolamento del paziente e il diagramma di flusso della creazione del modello ML basato sui dati del testo clinico.La procedura US-PMWA, la valutazione post-ablazione e il protocollo di follow-up sono descritti in dettaglio nei metodi supplementari 1.1 e 1.2.Figura 1 Il percorso di arruolamento del paziente e il diagramma di flusso della creazione del modello ML.Figura 1 Il percorso di arruolamento del paziente e il diagramma di flusso della creazione del modello ML.Abbiamo sviluppato e convalidato i modelli predittivi per la ricorrenza per confermare la stabilità e la ripetibilità dei modelli ML applicati nello studio.Quindi, 1069 pazienti sono stati assegnati al set di formazione e 268 sono stati assegnati al set di validazione interna sulla base di un rapporto 4:1 presso l'ospedale 1 (Chinese PLA General Hospital).Inoltre, 237 pazienti con carcinoma epatocellulare degli altri tre ospedali (The Third Affiliated Hospital of Harbin Medical University, The Second Hospital of Nanjing e The Tianyou Hospital of Wuhan University of Science and Technology) sono stati assegnati al set di validazione esterna durante lo stesso periodo .I dati variabili con un rapporto mancante maggiore del 20% sono stati esclusi dal nostro studio.Un totale di 36 variabili sono state raccolte per sviluppare i modelli predittivi.Innanzitutto, 36 variabili (Tabella S1) sono state analizzate mediante un'analisi univariata utilizzando LR.Successivamente, le variabili con differenze significative sono state utilizzate per regolare automaticamente il numero di variabili attraverso l'eliminazione delle caratteristiche ricorsive con convalida incrociata (RFECV) per ottenere la migliore combinazione di caratteristiche.16 L'RFECV comprende due parti: l'eliminazione delle caratteristiche ricorsive e la convalida incrociata.Dato uno stimatore esterno, l'eliminazione ricorsiva delle caratteristiche (RFE) seleziona le caratteristiche considerando ricorsivamente insiemi di caratteristiche sempre più piccoli.In primo luogo, lo stimatore viene addestrato sull'insieme iniziale di caratteristiche e viene ottenuta anche l'importanza iniziale di ciascuna caratteristica.Quindi, le funzionalità meno importanti vengono eliminate dal set di funzionalità corrente.La procedura viene ripetuta ricorsivamente sul gruppo potato fino al raggiungimento del numero di caratteristiche desiderate da selezionare.La convalida incrociata garantisce l'affidabilità di ogni fase della potatura.In questo studio, per sviluppare e convalidare i modelli predittivi sono stati utilizzati un metodo statistico convenzionale, LR e tre algoritmi di classificazione ML convenzionali (random forest (RF), support vector machine (SVM) ed eXtreme Gradient Boosting (XGBoost)). ,18 Questi modelli sono stati sottoposti a un'ottimizzazione continua dei parametri per confrontare gli effetti di adattamento e la capacità predittiva di ciascun modello.Per ogni studente di base, l'algoritmo XGBoost ottimizzato campiona casualmente il 50% dei dati e l'80% delle funzionalità per l'allenamento.Ogni iterazione seleziona la funzione con il maggiore guadagno di informazioni corrente come nodo.Quando viene raggiunta la soglia predefinita, questo apprendente di base è completato.Dato un tasso di apprendimento di 0,01, il modello predittivo completa la costruzione di 901 apprendenti di base, ciascuno dei quali è adattato in base al residuo del precedente.Cioè, calcoliamo la funzione di perdita della previsione corrente e il valore effettivo e minimizziamo l'espansione di Taylor del secondo ordine della funzione di perdita.Per aumentare la capacità di generalizzazione del modello, XGBoost limita la profondità massima dell'albero a 2 e ottimizza i parametri di peso del modello in termini di regolarizzazione L1 e L2.(1)Gli altri tre modelli predittivi sono introdotti in dettaglio nei metodi supplementari 1.3 e nelle figure S1–S3.I dati della coda di convalida sono stati utilizzati per valutare le prestazioni di previsione del modello e calcolare l'area sotto la caratteristica dell'operatore del ricevitore (AUC).È stata tracciata una curva di calibrazione, è stato misurato il grado di calibrazione del modello ed è stato valutato il grado di coerenza tra il rischio previsto e il rischio effettivo del modello.I modelli Advanced ML sono generalmente scatole nere.Sebbene questi modelli mantengano una buona precisione, tali metriche possono essere fuorvianti.In questo studio, abbiamo utilizzato gli algoritmi SHAP e LIME come algoritmi di interpretazione del modello di scatola nera ML.19–21L'algoritmo SHAP è un approccio teorico di gioco che spiega l'output di qualsiasi modello ML.Collega l'allocazione ottimale del credito con le spiegazioni locali utilizzando i classici valori di Shapley della teoria dei giochi.L'algoritmo calcola il contributo marginale di una caratteristica quando viene aggiunta al modello e quindi considera se il fattore è diverso in tutte le sequenze di fattori.Il contributo marginale spiega pienamente l'influenza di tutti i fattori inclusi nel modello di previsione e distingue gli attributi dei fattori (fattori di rischio/fattori di protezione).L'algoritmo LIME viene utilizzato per approssimare localmente il modello della scatola nera attribuendo pesi all'input del disturbo in modo tale che il modello di osservazione fornisca la base per l'interpretazione dei risultati della previsione del campione.Nel presente studio, abbiamo campionato casualmente il set di validazione e utilizzato l'algoritmo LIME per adattare il comportamento predittivo del modello al fine di verificare la razionalità della base del modello per la previsione dei risultati.Ciò può migliorare notevolmente la credibilità dell'interazione uomo-computer.Le variabili continue sono state date come mediana con intervallo interquartile (IQR) e confrontate con il test di Kruskal-Wallis.Le variabili categoriali sono state presentate come frequenze con percentuali e confrontate con il test del chi quadrato.Le curve di sopravvivenza sono state calcolate utilizzando il metodo Kaplan-Meier e confrontate con il test Log rank.Le analisi di regressione univariata di Cox sono state applicate per calcolare gli hazard ratio (HR) e il corrispondente intervallo di confidenza al 95% (CI) delle variabili e identificare fattori prognostici indipendenti.La discriminazione, l'accuratezza predittiva e la calibrazione del modello sono state valutate mediante AUC e curva di calibrazione.Dato che una rapida valutazione dei livelli di rischio di recidiva con valori di cutoff potrebbe essere utile nella pratica clinica di routine, sulla base delle soglie dei valori di cutoff ottimali per i punteggi determinati dalle statistiche log-rank massimamente selezionate, abbiamo stratificato i pazienti in basso rischio, medio sottogruppi a rischio e ad alto rischio.Tutte le analisi statistiche sono state condotte utilizzando la versione R 4.0.4.Un valore p a due code inferiore a 0,05 è stato considerato statisticamente significativo.In un periodo di follow-up di 10 anni, la durata mediana del follow-up è stata di 25,7 mesi (IQR, 6,3, 160,7 mesi), 26,9 mesi (IQR, 6,5, 159,2 mesi) e 23,7 mesi (IQR, 7,2, 124,8 mesi) nel training set, nel set di validazione interna e nel set di validazione esterna, rispettivamente, senza differenze significative (P = 0,139).Le caratteristiche di base dei pazienti nei tre set di dati sono delineate nella Tabella 1. La recidiva 512/1574 (32,5%) si è verificata 2 anni dopo MWA.Tutti i pazienti con carcinoma epatocellulare sono stati sottoposti ad ablazione completa e il 35,1% (375/1069), il 30,2% (81/268) e il 28,7% (68/237) hanno manifestato recidiva a 2 anni dopo la MWA nel training set, nel set di validazione interna e nel set di validazione, rispettivamente.Tra questi, il tasso di recidiva locale era rispettivamente del 9,2% (98/1069), del 7,1% (19/268) e dell'8,0% (19/237).Tabella 1 Le caratteristiche di base dei pazienti in tre set di datiTabella 1 Le caratteristiche di base dei pazienti in tre set di datiIn base a 36 fattori di rischio per l'analisi di correlazione, la mappa termica della matrice del coefficiente di correlazione delle caratteristiche (Figura 2) ha mostrato che le prime cinque caratteristiche erano correlate negativamente con i risultati erano piastrine (PLT), tempo di ablazione, attività protrombinica (PTA), colinesterasi (CHE ) e α-fetoproteina (AFP).Le prime cinque caratteristiche correlate positivamente con i risultati erano il numero di tumori, il grado del bambino, il sesso, l'eziologia e la bilirubina totale (Tbil).Dato che 36 variabili potrebbero interferire tra loro, riducendo così la capacità predittiva finale dei modelli ML, abbiamo utilizzato la regressione di Cox univariata per escludere 17 fattori di rischio con differenze statistiche.I risultati dell'analisi di Cox univariata per l'esito della ricorrenza sono riassunti nella Tabella 2. Abbiamo inserito questi 17 fattori negli algoritmi ML per sviluppare e convalidare il modello predittivo per la ricorrenza dopo MWA.Tabella 2 I risultati dell'analisi univariata per l'esito della ricorrenzaFigura 2 La mappa termica della matrice del coefficiente di correlazione di tutte le 36 variabili.(A) L'analisi di correlazione di 18 variabili compresa l'età;(B) l'analisi di correlazione delle altre 18 variabili tra cui RBC.Tabella 2 I risultati dell'analisi univariata per l'esito della ricorrenzaFigura 2 La mappa termica della matrice del coefficiente di correlazione di tutte le 36 variabili.(A) L'analisi di correlazione di 18 variabili compresa l'età;(B) l'analisi di correlazione delle altre 18 variabili tra cui RBC.I quattro modelli ML, i codici e i processi di costruzione sono descritti in dettaglio nella Tabella S2.Inoltre, elenchiamo i valori AUC a 1 e 2 anni dei tre set di dati dei diversi modelli predittivi applicati nella Tabella 3. Censurando fino a 2 anni dopo MWA, i valori AUC del modello XGBoost erano 0,74 (intervallo di confidenza 95% [ CI], 0,71–0,77), 0,67 (IC al 95%, 0,59–0,71) e 0,73 (IC al 95%, 0,66–0,79) rispettivamente per il set di addestramento, il set di validazione interna e il set di validazione esterna, che hanno avuto i risultati migliori capacità predittiva tra tre modelli ML e ha sovraperformato significativamente il modello LR (P <0,001) (Figura 3).La robustezza del modello predittivo ML è stata ulteriormente esplorata in un'analisi di sottogruppi.I risultati dello screening di RFECV hanno mostrato (Figura S4) che quando le 9 variabili sono state mantenute, XGBoost ha mostrato la migliore accuratezza predittiva e discriminazione.XGBoost ha ordinato in anticipo le nove variabili in base ai valori delle caratteristiche e le ha memorizzate come una struttura a blocchi, il che è conveniente per query rapide ogni volta che un nodo viene diviso.I grafici di calibrazione per l'esito della ricorrenza avevano un buon valore predittivo e sono stati validati bene nel set di convalida interno (Figura S5A) e nel set di convalida esterno (Figura S5B).Il modello XGBoost ha continuato a mostrare una buona accuratezza predittiva e discriminazione in diversi sottogruppi di pazienti stratificati secondo le nove variabili (Tabella S3).Tabella 3 Riepilogo delle prestazioni predittive di più modelliFigura 3 Le curve ROC di quattro modelli in tre set di dati, (A) il set di addestramento;(B) il set di validazione interna;(C) il set di validazione esterna.Tabella 3 Riepilogo delle prestazioni predittive di più modelliFigura 3 Le curve ROC di quattro modelli in tre set di dati, (A) il set di addestramento;(B) il set di validazione interna;(C) il set di validazione esterna.Abbiamo identificato due valori di cutoff ottimali (34,12 e 73,35) del modello XGBoost per stratificare i pazienti in gruppi a basso, medio e alto rischio nelle coorti di formazione.I tassi cumulativi di sopravvivenza libera da recidiva (RFS) a 1, 2, 3, 4 e 5 anni erano del 55%, 42%, 13%, 7% e 3% nel gruppo a basso rischio, 74 %, 62%, 34%, 25% e 19% nel gruppo a rischio medio e rispettivamente 97%, 85%, 59%, 48% e 30% nel gruppo ad alto rischio, che hanno avuto un differenza statistica tra i tre gruppi (P <0,001) (Figura 4A).Sia nella coorte di validazione interna (valore di cutoff, 62,31 e 112,21) che esterna (valore di cutoff 60,98 e 117,30), i tassi RFS cumulativi a 1, 2, 3, 4 e 5 anni tra i soggetti ad alto rischio , i gruppi a rischio medio e a basso rischio avevano anche una differenza statistica significativa (entrambi, P <0,001) (Figura 4B e C).Un sistema di intelligenza artificiale per la previsione della ricorrenza dopo l'accesso online a MWA è disponibile all'indirizzo http://114.251.235.51:8001/ (Figura S6).Figura 4 La stratificazione del rischio del Modello XGBoost.(A) Il set di addestramento;(B) il set di validazione interna;(C) il set di validazione esterna.Figura 4 La stratificazione del rischio del Modello XGBoost.(A) Il set di addestramento;(B) il set di validazione interna;(C) il set di validazione esterna.Abbiamo utilizzato gli algoritmi SHAP e LIME per visualizzare l'influenza di ciascuna variabile nel modello XGBoost sulla variabile di risultato nella Figura 5. Sulla base dell'algoritmo SHAP, l'influenza di nove variabili sul risultato nel modello XGBoost è mostrata nella Figura S7.La classifica dell'importanza delle caratteristiche era la seguente (Figura S8): numero di tumori, PLT, AFP, punteggio di comorbidità (CS), WBC, CHE, PT, NEU ed eziologia.Il numero di tumori, PLT e CS ha avuto effetti approssimativamente lineari sull'esito;il numero di tumori e CS erano positivamente correlati all'esito.Vale la pena notare che il CS si è stabilizzato dopo cinque punti;Il PLT era correlato negativamente con l'esito;quando il valore era maggiore di 150, l'impatto diventava stabile. Gli effetti di AFP, WBC e CHE sull'esito avevano tutti picchi e minimi e, oltre il valore SHAP, si stabilizzavano gradualmente.L'influenza di PT e NEU sul risultato è stata leggermente più complicata.Il valore SHAP dell'eziologia era vicino a 0, il che ha avuto scarso effetto sull'esito.L'algoritmo LIME ha spiegato le previsioni del modello XGBoost su ciascun campione e ha riassunto le previsioni del modello nel set di addestramento, nel set di convalida interno e nel set di test esterno, mostrando la distribuzione di quattro tipi di risultati: vero positivo, vero negativo, falso positivo e falso negativo.Complessivamente, il numero di campioni previsti come veri positivi e negativi rappresentava entrambi il 70%, indicando che le prestazioni del modello di previsione XGBoost sono relativamente stabili Inoltre, abbiamo selezionato casualmente quattro tipi di campioni (vero positivo, vero negativo, falso positivo , falso negativo) e li ha visualizzati separatamente.Quando la probabilità di previsione del modello è lontana da 0,5, il medico deve solo giudicare se il risultato della previsione è ragionevole in base alla base di previsione del modello fornita da LIME.Se la base di previsione del modello è irragionevole, il risultato non sarà adottato;quando la probabilità prevista del modello è vicina a 0,5, tali campioni sono generalmente difficili da giudicare clinicamente.Figura 5 Interpretazione del modello XGBoost.(A–C) algoritmi SHAP per visualizzare l'influenza di ciascuna variabile nel modello XGBoost;(D ed E) Algoritmi LIME per visualizzare l'influenza di ciascuna variabile nel modello XGBoost.Figura 5 Interpretazione del modello XGBoost.(A–C) algoritmi SHAP per visualizzare l'influenza di ciascuna variabile nel modello XGBoost;(D ed E) Algoritmi LIME per visualizzare l'influenza di ciascuna variabile nel modello XGBoost.In questo studio, abbiamo sviluppato e convalidato modelli di ML utilizzando dati clinici estratti direttamente dalle cartelle cliniche elettroniche per prevedere gli esiti individuali del pronto soccorso dopo MWA sulla base di una coorte di follow-up a lungo termine comprendente 1574 pazienti con carcinoma epatocellulare in stadio iniziale che sono stati raccomandati come candidati MWA .Questi risultati dell'analisi suggeriscono che il modello XGBoost ha prestazioni e discriminazione più favorevoli rispetto agli altri tre modelli ML predittivi, che identificano tre strati di rischio ER e aiutano ulteriori medici ad analizzare il beneficio di sopravvivenza dei pazienti con carcinoma epatocellulare.È stato eseguito uno studio del mondo reale basato su una coorte multicentrica consecutiva, con un campione di grandi dimensioni da quattro centri medici ad alto volume impostando tre coorti, che hanno assicurato la stabilità dell'algoritmo ML. I dati clinici disponibili sui biomarcatori per la previsione di ER sono stati ottenuti.I fattori di rischio precedentemente identificati per ER epatico dopo LA includevano principalmente la dimensione, il numero e il livello di AFP del tumore.21-23 Tuttavia, queste variabili cliniche che predicono la recidiva post-ablazione rimangono controverse a causa delle differenze individuali nei pazienti e dell'eterogeneità del tumore.Inoltre, i sistemi di stadiazione tradizionali, come la metastasi del nodo tumorale (TNM), il grado del cancro del fegato della clinica di Barcellona (BCLC) e il punteggio di Okuda, sono stati utilizzati per cercare di prevedere gli esiti dell'HCC,24 ma avevano una capacità predittiva insufficiente sulla recidiva postoperatoria.Fattori patologici aggressivi, tra cui invasione microvascolare (MVI), lesioni microsatelliti e grado patologico, potrebbero fornire preziose informazioni sulla capacità di invasione del tumore, che è associata a recidiva precoce dopo SR.25,26 Tuttavia, la diagnosi preoperatoria si basa principalmente sulla biopsia durante la procedura MWA , e il tessuto patologico completo non può essere ottenuto, quindi è stato difficile raccogliere informazioni patologiche efficaci per MWA.La funzione di imaging riflette comunemente le caratteristiche aggressive di un tumore;pertanto, sono stati costruiti diversi modelli radiomici per la previsione della recidiva dell'HCC negli ultimi 5 anni.Tra questi, sono stati sviluppati due modelli predittivi radiomici di recidiva post-ablazione.Yuan et al hanno riferito che è stato sviluppato un nomogramma radiomico basato su una TC con mezzo di contrasto per predire la recidiva precoce di casi di carcinoma epatocellulare idonei per l'ablazione curativa e l'indice C del modello radiomico e della radiomica, combinato con un modello clinico, era 0,72 e 0,79, rispettivamente.27 Shen et al hanno riferito che un modello radiomico basato su un'immagine TC post-trattamento è stato costruito per predire la recidiva precoce dopo l'ablazione e il valore AUC era 0,89.28 Poiché il modello radiomico sopra menzionato richiede 200-300 casi , non è sufficiente fornire informazioni e verifiche sui big data, causando stabilità e robustezza inadeguate.Inoltre, l'estrazione delle caratteristiche è complicata e dipende dal modello, che è difficile da applicare e manca di visualizzazione dell'immagine.In quanto modo conveniente e non invasivo, i dati del testo clinico sono una scelta migliore.Pertanto, abbiamo deciso di stabilire un modello ML per la previsione del rischio ER basato sui dati del testo clinico.I modelli predittivi basati sull'algoritmo XGBoost, con vantaggi tra cui un'efficiente potenza di calcolo e la capacità di gestire i valori mancanti, sono stati costruiti e testati tramite due set di validazione, che ne hanno ulteriormente assicurato la stabilità.Nel nostro studio, il modello XGBoost potrebbe ridurre gli autovalori di un gran numero di cartelle cliniche elettroniche rispetto agli altri modelli.In termini di elaborazione del valore mancante, l'algoritmo XGBoost potrebbe gestire automaticamente i dati mancanti aggiungendo una direzione predefinita basata sull'apprendimento durante la procedura di addestramento in ciascun nodo dell'albero.Quando un valore mancava nei dati di convalida, l'istanza veniva classificata nella direzione predefinita.In questo studio, 36 variabili sono state inserite nel modello XGBoost e 9 variabili sono state emesse per sviluppare le prestazioni predittive ottimali in questo studio, con valori AUC rispettivamente di 0,74 e 0,73 nei set di dati di addestramento e convalida.ML ha una notevole potenza di calcolo e non sarà influenzato da campioni di grandi dimensioni o dati multidimensionali.Lo sviluppo del modello predittivo che utilizza il ML per aiutare i medici a formulare piani di trattamento di follow-up nella pratica clinica è in aumento.29,30 Ad esempio, una valutazione prognostica precisa di COVID-19 in una terapia intensiva è stata costruita con metodi ML in grado di escludere accuratamente gruppi ad alto rischio e guidano i medici nella prevenzione e nel trattamento in modo efficace.31 Inoltre, in più centri è stato sviluppato un modello ML per predire gli esiti renali nella nefropatia da IgA, che può aiutare i medici nell'uso razionale del farmaco in base a questi risultati predittivi.32 Allo stesso modo , il nostro modello di algoritmo XGBoost ha mostrato la capacità di generalizzare tra popolazioni e protocolli di screening.Ciò suggerisce che nelle future implementazioni cliniche, il modello XGBoost offre ottime prestazioni di base ma può trarre vantaggio dalla messa a punto con i dati locali.I radiologi interventisti possono utilizzare la TACE preventiva o il trattamento chemioterapico neoadiuvante (NCT) per i casi di carcinoma epatocellulare ad alto rischio basato sulla previsione del modello ML e possono ridurre ulteriormente il rischio di recidiva dopo MWA, così "stroncandolo sul nascere", come si suol dire.In questo studio, abbiamo utilizzato gli algoritmi SHAP e ITME per spiegare il modello XGBoost perché è possibile accedere comodamente online alle scatole nere utilizzate per comprendere i principi alla base del modello ML.Dopo la spiegazione completa degli algoritmi SHAP e LIME, il modello XGBoost ha mostrato capacità di previsione accurata e stabile in ricorrenza.Tuttavia, parti dei dati delle variabili cliniche che non dovrebbero essere utilizzate potrebbero essere trapelate accidentalmente nei dati di addestramento.L'algoritmo SHAP calcola il contributo marginale di una caratteristica quando viene aggiunta al modello e quindi considera se le variabili sono diverse in tutte le sequenze di variabili.Il contributo marginale spiega pienamente l'influenza di tutte le variabili incluse nella previsione del modello e distingue gli attributi dei fattori (fattori di rischio/protettivi).Inoltre, abbiamo campionato casualmente il set di test e utilizzato l'algoritmo LIME per adattare il comportamento predittivo del modello per verificare la razionalità della base del modello per la previsione dei risultati.Questo approccio può migliorare notevolmente il valore di fiducia dell'interazione uomo-computer.Ci sono alcune limitazioni al nostro studio.In primo luogo, il rischio di bias di selezione è inevitabile negli studi osservazionali.Tuttavia, questo rischio è stato ridotto al minimo dall'inclusione di tutti i pazienti consecutivi e da un'ampia coorte di casi precoci di HCC per MWA fino ad oggi.In secondo luogo, la coorte non proveniva da uno studio terapeutico prospettico a causa della natura della ricerca retrospettiva;pertanto, una parte dei dati era carente.Fortunatamente, il modello XGBoost ha avuto la capacità di gestire i valori mancanti in questo studio.Tutti i diritti riservati.